iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0
生成式 AI

我的 AI 學習之路:30天 Gemma 與 Gemini系列 第 2

我的 AI 學習之路:第2天 Gemma 與 Gemini - Gemma家族

  • 分享至 

  • xImage
  •  

Gemma

從2024年初發表Gemma 到現在1年多,已經到Gemma 3 了,我們來看看Gemma 家族有什麼模型吧!

Model

Gemma 1 初試啼聲,奠定基礎

作為家族的開創者,第一代 Gemma 提供了兩種尺寸,迅速在開發者社群中普及:

Gemma 2B:輕巧高效,適合在筆記型電腦或資源有限的環境中運行,主要用於研究和實驗。

Gemma 7B:在保持相對較小規模的同時,提供了與當時其他大型模型相媲美的卓越效能,特別是在英文、程式碼與數學推理方面。

Gemma 2:效能躍升,尺寸更多元

Gemma 2 在第一代的基礎上進行了顯著升級,提供了更高的效能和更佳的推理效率,並引入了新的模型尺寸:

Gemma 2B:進一步優化,效能超越前代。

Gemma 9B:全新的中量級尺寸,在效能與資源需求之間取得絕佳平衡。

Gemma 27B:為需要頂尖效能的任務而生,在同尺寸級別的模型中具備領先的表現。

Gemma 3:多模態與多語言的全面進化

Gemma 3 是家族的最新成員,帶來了多模態輸入和更廣泛的多語言支援,並進一步擴展了模型尺寸,使其應用範圍更為廣泛:

多樣化的尺寸:提供從 1B、4B、12B 到 27B 的多種尺寸,滿足從行動裝置到雲端伺服器的不同部署需求。

Gemma 3n:專為行動裝置優化的版本,在低延遲的音訊和視覺理解方面表現出色。

Gemma 270m : 用於特定任務的微調,並已訓練有素,具有強大的指令跟踪和文本結構化能力。

Gemma 家族還針對特定領域推出了多款專業模型:

CodeGemma:為程式碼而生 2B/7B

這是一個專為程式碼相關任務設計的模型系列,支援多種主流程式語言,如 Python, Java, C++, JavaScript 等。

PaliGemma:視覺語言理解專家

PaliGemma 是一款多模態模型,結合了視覺模型 (SigLIP) 和大型語言模型 (Gemma),使其能夠理解圖像和文字的關聯。

ShieldGemma 2:一個基於 Gemma 3 的圖像安全分類器,用於檢測和過濾不當內容。

T5Gemma:採用編碼器-解碼器 (Encoder-Decoder) 架構,擅長需要深度上下文理解的任務。

DataGemma:與 Google Data Commons 知識庫結合,能提供基於公共統計數據的回答。

RecurrentGemma:基於創新的 Griffin 架構,探索非 Transformer 模型在語言處理上的可能性。

MedGemma:針對醫療領域進行訓練,用於理解和處理醫療相關的文字與圖像資料。

模型家族	 |  主要尺寸	 |  核心特色	 | 主要應用場景

Gemma 1	 | 2B, 7B	 | 開放式、僅解碼器架構	 | 通用文字生成、研究實驗

Gemma 2	 | 2B, 9B, 27B	 | 混合注意力、更長上下文、高效能	 | 複雜的長文本處理、企業級應用

Gemma 3	 | 1B, 4B, 12B, 27B	 | 多模態輸入、超長上下文 (128K)、多語言	 | 視覺問答、多語言應用、行動裝置部署

CodeGemma	 | 2B, 7B	 | 專為程式碼優化	 | 程式碼開發輔助、自動化程式設計

PaliGemma	 | 3B	 | 視覺與語言結合	 | 圖像理解、多模態資料分析

##大家可以不同的特性來選用 Gemma 模型


上一篇
我的 AI 學習之路: 第1天 Gemma 與 Gemini - 科普
下一篇
我的 AI 學習之路:第3天 Gemma 與 Gemini - 執行 Gemma
系列文
我的 AI 學習之路:30天 Gemma 與 Gemini4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言